RAG 检索基础使用

视频教程

学习建议

本章节将指导您快速入门 PIG AI 的 RAG (检索增强生成) 功能,基础篇使用【硅基流动】平台提供充足的免费调用额度,满足大多数用户的日常需求。先熟悉本章节内容,再深入研究私有化部署章节方案,一口吃不了大胖子。

模型类型模型名称
聊天模型deepseek-ai/DeepSeek-V3
向量模型Qwen/Qwen3-Embedding-8B
排序模型Qwen3-Reranker-8B
视觉模型Qwen/Qwen2.5-VL-72B-Instruct

一、配置模型

获取大模型 KEY

推荐平台

推荐使用硅基流动平台获取免费的大模型 Token。该平台部署的均是开源模型,安全可信,且便于后续私有化部署。 点击访问硅基流动平台

获取大模型Token界面

配置模型

模型列表没有指定模型?

新增模型【硅基流动】配置支持,如果发现没有对应模型名称,请更新最新的代码或者手动录入(下拉框支持手动输入)。

在模型配置页面,选择对应的模型类型并配置相关参数:

模型类型推荐模型
聊天模型deepseek-ai/DeepSeek-V3
向量模型Qwen/Qwen3-Embedding-8B
重排模型Qwen3-Reranker-8B
视觉模型Qwen/Qwen2.5-VL-72B-Instruct
配置聊天模型界面

二、配置向量数据库

milvus 提供 cloud 版本在线使用版本,适合本地快速测试使用,刚上手 PIGAI 请使用这个方式

MilvusCloud 注册界面

PIG AI 向量配置

PIG AI 向量配置界面

三、知识库配置

3.1 创建知识库

在知识库管理页面点击新增按钮创建知识库。

创建知识库界面
配置说明
  • 高级配置、安全配置参数正常情况下不需要修改
  • 匹配率、匹配条数:决定了大模型匹配的幻觉率,比如匹配率越低,在知识内容较少的情况下,大模型匹配的幻觉率越高(胡说八道)。建议根据自己实际情况动态调整此处参数

3.2 上传资料

在知识库管理页面选择已创建的知识库,点击上传资料。

上传资料界面

文件处理状态说明:

状态说明
未切片上传文件后的状态
已切片文件已经解析并切割成一段段的文本
已总结通过大模型生成的整个文本的缩略信息,提高准确性
已训练(切片管理)通过大模型生成的文本向量并入向量库
文件处理状态界面

3.3 切片管理

上传至知识库的资料会自动切片,切片管理可以查看切片详情,点击切片即可编辑。

切片管理界面
训练完成标志

当右上角显示已训练的标识时,则说明文档已经调用大模型生成了切片的向量并存储到向量数据库。

四、问答测试调用

在 AI 助手页面点击具体的文档库,进行针对性的问答调用。

问答测试调用界面